2025年9月8日中文

探索 JavaScript SharedArrayBuffer 内存模型和原子操作，为 Web 和 Node.js 带来高效安全的并发编程。了解数据竞争、内存同步及原子操作的最佳实践。

JavaScript SharedArrayBuffer 内存模型：原子操作语义

现代 Web 应用程序和 Node.js 环境日益需要高性能和高响应性。为了实现这一点，开发人员通常会转向并发编程技术。传统上单线程的 JavaScript 现在提供了强大的工具，如 SharedArrayBuffer 和 Atomics，以实现共享内存并发。本博客文章将深入探讨 SharedArrayBuffer 内存模型，重点关注原子操作的语义及其在确保安全高效并发执行中的作用。

SharedArrayBuffer 和 Atomics 简介

SharedArrayBuffer 是一种数据结构，它允许多个 JavaScript 线程（通常在 Web Workers 或 Node.js worker 线程内）访问和修改同一块内存空间。这与传统的涉及在线程之间复制数据的消息传递方法形成对比。直接共享内存可以显著提高某些计算密集型任务的性能。

然而，共享内存引入了数据竞争的风险，即多个线程试图同时访问和修改同一内存位置，导致不可预测甚至不正确的结果。Atomics 对象提供了一组原子操作，确保对共享内存的安全和可预测访问。这些操作保证对共享内存位置的读取、写入或修改操作作为一个单一的、不可分割的操作发生，从而防止数据竞争。

理解 SharedArrayBuffer 内存模型

SharedArrayBuffer 暴露了一个原始内存区域。理解内存访问在不同线程和处理器之间的处理方式至关重要。JavaScript 保证了一定程度的内存一致性，但开发人员仍需注意潜在的内存重排序和缓存效应。

内存一致性模型

JavaScript 采用松散内存模型。这意味着在一个线程上看起来的操作执行顺序，可能与它们在另一个线程上看起来的执行顺序不同。编译器和处理器可以自由地重排指令以优化性能，只要单个线程内的可观察行为保持不变即可。

考虑以下示例（已简化）：

// 线程 1
sharedArray[0] = 1; // A
sharedArray[1] = 2; // B

// 线程 2
if (sharedArray[1] === 2) { // C
 console.log(sharedArray[0]); // D
}

如果没有适当的同步，线程 2 可能在线程 1 完成将 1 写入 sharedArray[0] (A) 之前就看到 sharedArray[1] 为 2 (C)。因此，console.log(sharedArray[0]) (D) 可能会打印出一个意外或过时的值（例如，初始的零值或上一次执行的值）。这突显了同步机制的关键需求。

缓存与一致性

现代处理器使用缓存来加速内存访问。每个线程可能都有自己对共享内存的本地缓存。这可能导致不同线程看到同一内存位置的不同值的情况。内存一致性协议确保所有缓存保持一致，但这些协议需要时间。原子操作从本质上处理缓存一致性，确保数据在各线程间保持最新。

原子操作：安全并发的关键

Atomics 对象提供了一组旨在安全访问和修改共享内存位置的原子操作。这些操作确保读取、写入或修改操作作为一个单一的、不可分割的（原子的）步骤发生。

原子操作的类型

Atomics 对象为不同数据类型提供了一系列原子操作。以下是一些最常用的操作：

Atomics.load(typedArray, index)：原子性地从 TypedArray 的指定索引读取一个值。返回读取到的值。
Atomics.store(typedArray, index, value)：原子性地将一个值写入 TypedArray 的指定索引。返回写入的值。
Atomics.add(typedArray, index, value)：原子性地将一个值与指定索引处的值相加。返回相加后的新值。
Atomics.sub(typedArray, index, value)：原子性地从指定索引处的值中减去一个值。返回相减后的新值。
Atomics.and(typedArray, index, value)：原子性地在指定索引处的值与给定值之间执行按位与操作。返回操作后的新值。
Atomics.or(typedArray, index, value)：原子性地在指定索引处的值与给定值之间执行按位或操作。返回操作后的新值。
Atomics.xor(typedArray, index, value)：原子性地在指定索引处的值与给定值之间执行按位异或操作。返回操作后的新值。
Atomics.exchange(typedArray, index, value)：原子性地将指定索引处的值替换为给定值。返回原始值。
Atomics.compareExchange(typedArray, index, expectedValue, replacementValue)：原子性地比较指定索引处的值与 expectedValue。如果它们相等，则将该值替换为 replacementValue。返回原始值。这是无锁算法的关键构建块。
Atomics.wait(typedArray, index, expectedValue, timeout)：原子性地检查指定索引处的值是否等于 expectedValue。如果是，则线程被阻塞（进入睡眠状态），直到另一个线程在同一位置调用 Atomics.wake()，或 timeout 超时。返回一个字符串，指示操作的结果（'ok'、'not-equal' 或 'timed-out'）。
Atomics.wake(typedArray, index, count)：唤醒在 TypedArray 的指定索引上等待的 count 个线程。返回被唤醒的线程数。

原子操作语义

原子操作保证以下几点：

原子性：操作作为一个单一的、不可分割的单元执行。没有其他线程可以在操作中途打断它。
可见性：原子操作所做的更改对所有其他线程立即可见。内存一致性协议确保缓存得到适当更新。
有序性（有限制）：原子操作对不同线程观察到操作的顺序提供了一些保证。然而，确切的排序语义取决于具体的原子操作和底层硬件架构。在更高级的场景中，内存排序（例如，顺序一致性、获取/释放语义）等概念就变得相关了。JavaScript 的 Atomics 提供的内存排序保证比其他一些语言弱，因此仍需要仔细设计。

原子操作的实践示例

让我们看一些如何使用原子操作解决常见并发问题的实际例子。

1. 简单计数器

以下是如何使用原子操作实现一个简单的计数器：

const sab = new SharedArrayBuffer(Int32Array.BYTES_PER_ELEMENT); // 4 字节
const counter = new Int32Array(sab);

function incrementCounter() {
 Atomics.add(counter, 0, 1);
}

function getCounterValue() {
 return Atomics.load(counter, 0);
}

// 示例用法（在不同的 Web Workers 或 Node.js worker 线程中）
incrementCounter();
console.log("Counter value: " + getCounterValue());

这个例子演示了使用 Atomics.add 来原子性地增加计数器。Atomics.load 获取计数器的当前值。因为这些操作是原子的，所以多个线程可以安全地增加计数器而不会发生数据竞争。

2. 实现锁（互斥锁）

互斥锁（mutual exclusion lock）是一种同步原语，它只允许一个线程在同一时间访问共享资源。这可以使用 Atomics.compareExchange 和 Atomics.wait/Atomics.wake 来实现。

const sab = new SharedArrayBuffer(Int32Array.BYTES_PER_ELEMENT);
const lock = new Int32Array(sab);
const UNLOCKED = 0;
const LOCKED = 1;

function acquireLock() {
 while (Atomics.compareExchange(lock, 0, UNLOCKED, LOCKED) !== UNLOCKED) {
 Atomics.wait(lock, 0, LOCKED, Infinity); // 等待直到解锁
 }
}

function releaseLock() {
 Atomics.store(lock, 0, UNLOCKED);
 Atomics.wake(lock, 0, 1); // 唤醒一个等待中的线程
}

// 示例用法
acquireLock();
// 临界区：在此处访问共享资源
releaseLock();

这段代码定义了 acquireLock，它尝试使用 Atomics.compareExchange 来获取锁。如果锁已经被持有（即 lock[0] 不是 UNLOCKED），线程将使用 Atomics.wait 等待。releaseLock 通过将 lock[0] 设置为 UNLOCKED 来释放锁，并使用 Atomics.wake 唤醒一个等待中的线程。`acquireLock` 中的循环对于处理伪唤醒（即 `Atomics.wait` 即使在条件未满足时也返回）至关重要。

3. 实现信号量

信号量是比互斥锁更通用的同步原语。它维护一个计数器，并允许一定数量的线程并发访问共享资源。它是互斥锁（即二进制信号量）的泛化。

const sab = new SharedArrayBuffer(Int32Array.BYTES_PER_ELEMENT);
const semaphore = new Int32Array(sab);
let permits = 2; // 可用许可的数量
Atomics.store(semaphore, 0, permits);

async function acquireSemaphore() {
 let current;
 while (true) {
 current = Atomics.load(semaphore, 0);
 if (current > 0) {
 if (Atomics.compareExchange(semaphore, 0, current, current - 1) === current) {
 // 成功获取一个许可
 return;
 }
 } else {
 // 没有可用许可，等待
 await new Promise(resolve => {
 const checkInterval = setInterval(() => {
 if (Atomics.load(semaphore, 0) > 0) {
 clearInterval(checkInterval);
 resolve(); // 当有可用许可时解析 promise
 }
 }, 10);
 });
 }
 }
}

function releaseSemaphore() {
 Atomics.add(semaphore, 0, 1);
}

// 示例用法
async function worker() {
 await acquireSemaphore();
 try {
 // 临界区：在此处访问共享资源
 console.log("Worker executing");
 await new Promise(resolve => setTimeout(resolve, 100)); // 模拟工作
 } finally {
 releaseSemaphore();
 console.log("Worker released");
 }
}

// 并发运行多个 worker
worker();
worker();
worker();

此示例展示了一个使用共享整数来跟踪可用许可的简单信号量。注意：此信号量实现使用了带有 `setInterval` 的轮询，其效率低于使用 `Atomics.wait` 和 `Atomics.wake`。然而，由于等待线程缺乏 FIFO 队列，JavaScript 规范使得仅使用 `Atomics.wait` 和 `Atomics.wake` 来实现具有公平性保证的完全兼容的信号量变得困难。要实现完整的 POSIX 信号量语义，需要更复杂的实现。

使用 SharedArrayBuffer 和 Atomics 的最佳实践

有效地使用 SharedArrayBuffer 和 Atomics 需要仔细的规划和对细节的关注。以下是一些应遵循的最佳实践：

最小化共享内存：只共享绝对需要共享的数据。减少攻击面和潜在的错误。
审慎使用原子操作：原子操作的开销可能很高。仅在必要时使用它们来保护共享数据免受数据竞争。对于不太关键的数据，可以考虑使用消息传递等替代策略。
避免死锁：在使用多个锁时要小心。确保线程以一致的顺序获取和释放锁，以避免死锁，即两个或多个线程无限期地阻塞，相互等待。
考虑无锁数据结构：在某些情况下，可以设计无锁数据结构，从而无需显式锁。这可以通过减少争用来提高性能。然而，无锁算法的设计和调试是出了名的困难。
彻底测试：并发程序是出了名的难以测试。使用彻底的测试策略，包括压力测试和并发测试，以确保您的代码是正确和健壮的。
考虑错误处理：准备好处理并发执行期间可能发生的错误。使用适当的错误处理机制来防止崩溃和数据损坏。
使用类型化数组：始终将 TypedArrays 与 SharedArrayBuffer 一起使用，以定义数据结构并防止类型混淆。这可以提高代码的可读性和安全性。

安全考量

SharedArrayBuffer 和 Atomics API 一直存在安全问题，特别是关于类似 Spectre 的漏洞。这些漏洞可能允许恶意代码读取任意内存位置。为了减轻这些风险，浏览器已经实施了各种安全措施，例如站点隔离（Site Isolation）、跨源资源策略（CORP）和跨源开启者策略（COOP）。

使用 SharedArrayBuffer 时，必须配置您的 Web 服务器以发送适当的 HTTP 标头来启用站点隔离。这通常涉及设置 Cross-Origin-Opener-Policy (COOP) 和 Cross-Origin-Embedder-Policy (COEP) 标头。正确配置的标头可确保您的网站与其他网站隔离，从而降低类似 Spectre 的攻击风险。

SharedArrayBuffer 和 Atomics 的替代方案

虽然 SharedArrayBuffer 和 Atomics 提供了强大的并发能力，但它们也带来了复杂性和潜在的安全风险。根据用例，可能有更简单、更安全的替代方案。

消息传递：使用 Web Workers 或 Node.js worker 线程进行消息传递是共享内存并发的一种更安全的替代方案。虽然这可能涉及在线程之间复制数据，但它消除了数据竞争和内存损坏的风险。
异步编程：异步编程技术，如 promises 和 async/await，通常可以用来实现并发而无需诉诸共享内存。这些技术通常比共享内存并发更容易理解和调试。
WebAssembly：WebAssembly (Wasm) 提供了一个沙盒环境，用于以接近本机的速度执行代码。它可以用于将计算密集型任务卸载到单独的线程，同时通过消息传递与主线程通信。

用例与实际应用

SharedArrayBuffer 和 Atomics 特别适用于以下类型的应用程序：

图像和视频处理：处理大图像或视频可能是计算密集型的。使用 SharedArrayBuffer，多个线程可以同时处理图像或视频的不同部分，从而显著减少处理时间。
音频处理：音频处理任务，如混音、滤波和编码，可以从使用 SharedArrayBuffer 的并行执行中受益。
科学计算：科学模拟和计算通常涉及大量数据和复杂算法。SharedArrayBuffer 可用于将工作负载分配到多个线程，从而提高性能。
游戏开发：游戏开发通常涉及复杂的模拟和渲染任务。SharedArrayBuffer 可用于并行化这些任务，从而提高帧率和响应性。
数据分析：处理大型数据集可能非常耗时。SharedArrayBuffer 可用于将数据分布到多个线程，从而加速分析过程。一个例子可以是金融市场数据分析，其中对大型时间序列数据进行计算。

国际示例

以下是一些关于 SharedArrayBuffer 和 Atomics 如何在不同的国际环境中应用的理论示例：

金融建模（全球金融）：一家全球性金融公司可以使用 SharedArrayBuffer 来加速复杂金融模型的计算，例如投资组合风险分析或衍生品定价。来自不同国际市场的数据（例如，东京证券交易所的股价、货币汇率、债券收益率）可以加载到 SharedArrayBuffer 中，并由多个线程并行处理。
语言翻译（多语言支持）：一家提供实时语言翻译服务的公司可以使用 SharedArrayBuffer 来提高其翻译算法的性能。多个线程可以同时处理文档或对话的不同部分，从而减少翻译过程的延迟。这在世界各地支持各种语言的呼叫中心中尤其有用。
气候建模（环境科学）：研究气候变化的科学家可以使用 SharedArrayBuffer 来加速气候模型的执行。这些模型通常涉及需要大量计算资源的复杂模拟。通过将工作负载分配到多个线程，研究人员可以减少运行模拟和分析数据所需的时间。模型参数和输出数据可以通过 `SharedArrayBuffer` 在位于不同国家的高性能计算集群上运行的进程之间共享。
电子商务推荐引擎（全球零售）：一家全球性电子商务公司可以使用 SharedArrayBuffer 来提高其推荐引擎的性能。该引擎可以将用户数据、产品数据和购买历史加载到 SharedArrayBuffer 中，并并行处理以生成个性化推荐。这可以部署在不同的地理区域（例如，欧洲、亚洲、北美），为全球客户提供更快、更相关的推荐。

结论

SharedArrayBuffer 和 Atomics API 为在 JavaScript 中实现共享内存并发提供了强大的工具。通过理解内存模型和原子操作的语义，开发人员可以编写高效且安全的并发程序。然而，谨慎使用这些工具并考虑潜在的安全风险至关重要。如果使用得当，SharedArrayBuffer 和 Atomics 可以显著提高 Web 应用程序和 Node.js 环境的性能，特别是对于计算密集型任务。请记住考虑替代方案，优先考虑安全性，并进行彻底测试，以确保并发代码的正确性和健壮性。